点云 - 智狐AI导航

Janus

Janus是一种由DeepSeek AI开发的自回归框架，专注于多模态理解和生成任务的统一化。它通过分离视觉编码路径并使用单一Transformer架构来提升灵活性和性能，支持多种输入模态如图像、文本等，并在某些任务中表现出色。Janus具备多模态理解、图像生成及跨模态交互能力，适用于图像创作、自动标注、视觉问答等多个领域。

AI项目与工具 2025年06月12日 45 点赞 0 评论 733 浏览

MSQA

MSQA是一个包含251,000个问答对的大规模多模态情境推理数据集，支持文本、图像和点云等多种数据形式，旨在提升具身AI在三维场景中的理解与推理能力。通过设计MSQA和MSNN两个基准测试任务，该工具不仅能够评估模型性能，还能促进具身AI和3D场景理解领域的研究进展。同时，它为开发更强大的情境推理模型提供了丰富的预训练资源。

AI项目与工具 2025年06月12日 80 点赞 0 评论 635 浏览

ReCapture

ReCapture是一种先进的视频处理技术，由谷歌与新加坡国立大学联合研发。它通过多视图扩散模型和点云渲染生成新视角视频，同时使用掩码视频微调技术优化视频质量，保留场景运动并补全不可见部分，广泛应用于电影制作、视频编辑、虚拟现实及新闻报道等领域。

AI项目与工具 2025年06月12日 55 点赞 0 评论 570 浏览

DynaMem

DynaMem是一款由纽约大学与Hello Robot共同研发的动态空间语义记忆系统，旨在应对开放环境下的移动操作挑战。该系统通过构建特征点云来存储环境信息，并利用RGBD观测数据动态调整记忆库。它支持文本查询定位物体，同时具备强大的动态物体处理能力，广泛应用于家庭、工业、仓储管理以及灾难救援等多个领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 736 浏览

Find3D

Find3D是一款由加州理工学院开发的3D部件分割模型，通过自动化数据生成技术和对比学习方法，实现了高效且精准的3D对象分割。它能够在多个数据集上达到三倍于次优方法的性能提升，支持开放世界下的任意文本查询分割，广泛应用于机器人、虚拟现实、建筑设计等领域。

AI项目与工具 2025年06月12日 27 点赞 0 评论 738 浏览

DiffSplat

DiffSplat是一款高效的3D生成工具，能够根据文本或图像快速生成高质量的3D高斯点云。它基于预训练的文本到图像扩散模型，结合2D先验知识和3D渲染损失机制，确保生成内容在多视角下保持一致。支持文本、图像或组合输入，具备可控生成能力，适用于3D内容创作、图像重建及多种下游应用。

AI项目与工具 2025年06月12日 72 点赞 0 评论 829 浏览

AuraFusion360

AuraFusion360是一款面向360°无边界场景修复的AI工具，采用高斯散射表示和深度感知技术，实现高质量的物体移除与孔洞填充。其核心包括自适应引导深度扩散（AGDD）和基于SDEdit的细节增强，确保多视角一致性。适用于虚拟现实、建筑可视化、影视特效及文物修复等多个领域，提供高效、精确的场景修复解决方案。

AI项目与工具 2025年06月12日 57 点赞 0 评论 791 浏览

ENEL

ENEL是一种无编码器架构的3D大型多模态模型，通过直接处理点云数据并结合LLM实现高效语义编码与几何结构理解。其核心技术包括LLM嵌入的语义编码和分层几何聚合策略，在3D对象分类、字幕生成和视觉问答等任务中表现出色，性能接近更大规模模型。该模型适用于工业自动化、虚拟现实及复杂3D结构分析等领域。

AI项目与工具 2025年06月12日 53 点赞 0 评论 754 浏览

GEN3C

GEN3C是由NVIDIA、多伦多大学和向量研究所联合开发的生成式视频模型，基于点云构建3D缓存，结合精确的相机控制和时空一致性技术，实现高质量视频生成。支持从单视角到多视角的视频创作，具备3D编辑能力，适用于动态场景和长视频生成。在新型视图合成、驾驶模拟、影视制作等领域有广泛应用前景。

AI项目与工具 2025年06月12日 23 点赞 0 评论 648 浏览

TrajectoryCrafter

TrajectoryCrafter是一种基于双流条件视频扩散模型的单目视频相机轨迹重定向工具，支持用户自定义相机运动路径并生成高质量、4D一致的视频内容。其核心技术包括解耦视图变换与内容生成、动态点云渲染以及混合数据集训练策略，具备强大的场景泛化能力。适用于沉浸式娱乐、视频创作、智能会议、自动驾驶及教育等多个领域。

AI项目与工具 2025年06月12日 76 点赞 0 评论 851 浏览

点云

首页

点云

列表

默认

浏览次数

发布日期